# Author:keith
# -*-  codeing = utf-8 -*-
# @Time :2025/9/15 16:13
# @Author:17986
# @Site  :
# @File  :pdfWord.py
# @Software PyCharm

#  第一种方法
# import pdfplumber
import PyPDF2

#  第一种方法
# file_path = r'E:\桌面文件\国网项目\pdf文件\电子商务平台数据资源手册.PDF'
#
# with pdfplumber.open(file_path) as pdf:
#     page = pdf.pages[27]
#     print(page.extract_text())



# 第二种
def extract_text_with_pypdf2(pdf_path):
    """
    使用PyPDF2提取PDF中的文本
    """
    text = ""
    with open(pdf_path, 'rb') as file:
        reader = PyPDF2.PdfReader(file)
        for page in reader.pages:
            text += page.extract_text() + "\n"  # 提取每一页的文本
    return text

# 使用示例
pdf_path = 'E:\桌面文件\国网项目\pdf文件\电子商务平台数据资源手册.PDF'
text = extract_text_with_pypdf2(pdf_path)
print(text)